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基于 二 义 分 类 推理 的 昆虫 分 类 辅助 鉴定 多 媒体 
专家 系统 通用 平台 TaxoKeys 的 设计 与 开发 


高 灵 旺 ， 沈 佐 锐 ”， 刘 志 天 ， 蕊 上 晓 光 


(中 国 农 业 大 学 植保 学 院 ， 北 京 ” 100094) 


摘要 : 本 文 详细 介绍 了 基于 二 叉 式 分 类 推理 的 昆虫 分 类 辅助 鉴定 多 媒体 专家 系统 通用 平台 TaxoKeys 的 设计 与 开发 ， 及 其 所 
具备 的 主要 特点 。 该 研究 根据 昆虫 分 类 学 的 特点 ， 将 昆虫 分 类 的 两 项 式 检索 表 用 数据 库 表示 成 系统 知识 库 ， 利 用 计算 机 数 
据 结 构 中 二 又 树 结构 的 分 枝 结 点 搜索 技术 来 实现 其 推理 过 程 ， 进 行 昆 虫 分 类 的 辅助 鉴定 ， 为 昆虫 分 类 专家 提供 一 个 通用 专 
家 系统 平台 。 该 系统 具有 可 扩充 性 好 、 设 计 简 单 、 操 作 方 便 等 特点 ， 同 时 也 适用 于 一 般 性 生物 分 类 鉴定 。 另 外 ,本 文 还 就 
本 系统 功能 的 进一步 扩展 与 应 用 研究 等 进行 了 探讨 。 
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nomic identification, as well as the characteristics of the system. This system, named Taxokeys, is based on the dichoto- 
mous reasoning method . From expertise of insect taxonomy, dichotomous taxonomic keys for the Insecta can be revised in- 
to a knowledge database in terms of data structure using computer technology . This database can then be used as the basis 
for insect identification by searching for nodes within dichotomous irees of the data-stmcture until the final node is 
reached. In fact, the system is a generalized platform for insect taxonomists to develop their own multimedia expert sys- 
tems .Taxokeys has such features as ease of adding new data, simplicity in design, and simplicity of operation, and may 
be useful for biological identification and taxonomic study in general . The possibility of ncreasing additional functions and 
potential applications for this system are discussed. 
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虫 而 言 ， 要 准确 地 将 其 识别 出 来 或 者 要 确定 其 是 否 
为 一 个 新 种 ， 都 需要 经 过 查阅 大 量 的 昆虫 分 类 文 
献 ， 由 所 属 类 群 权威 的 昆虫 分 类 专家 最 终 确定 才能 


1 概述 


昆虫 岗 是 生物 多 样 性 最 丰富 的 一 个 类 和 群 ， 其 物 
种 数量 高 居所 有 生物 类 群 之 首 〈 黄 大 卫 ，2003)， 
是 动物 界 中 最 大 的 一 个 网 〈 彩 万 志 等 ，2001)。 由 
于 其 数目 庞大 ， 文 献 分 散 及 各 种 类 群 的 术语 又 不 统 
一 ， 除 了 专门 从 事 该 类 群 的 昆虫 分 类 专家 ， 一 般 人 
很 难 正 确 地 将 其 鉴定 到 种 。 因 此 ， 对 于 任何 一 种 昆 


达到 目的 。 这 里 所 说 的 “权威 的 昆虫 分 类 专家 ”是 
根据 他 们 对 昆虫 类 群 熟悉 程度 而 称谓 的 ， 如 专门 对 
膜 翅 目 昆 虫 分 类 研究 的 专家 可 称 为 膜 翅 目 分 类 专家 
等 。 如 何 设计 一 种 能 够 充分 利用 昆虫 分 类 专家 的 经 
验 与 知识 ， 快速、 准确 地 进行 昆虫 鉴定 的 工具 ， 以 
提高 工作 效率 成 为 昆虫 分 类 学 家 所 面临 的 一 个 难 
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题 ; 尤其 是 对 于 不 懂 或 对 昆虫 学 分 类 知识 所 知 很 少 
的 用 户 (如 农民 等 ) 而 言 ， 能 够 有 一 个 专门 的 昆虫 
分 类 鉴定 工具 供 其 使 用 ， 对 其 工作 将 有 极 大 的 帮 
助 。 

专家 系统 技术 作为 人 工 智 能 的 一 个 重要 分 文 在 
对 昆虫 分 类 研究 中 已 有 应 用 ， 如 澳大利亚 科 工 组 织 
堪培拉 昆虫 研究 部 (CSIRO Entomology Division in 
Canberra) 最 近 更 新 的 DELTA， 作 为 一 种 通用 而 功 
能 强大 的 分 类 描述 语言 ( Description Language for 
Taxonomy ) 可 用 于 构建 昆虫 分 类 的 检索 表 ， 得 到 了 
国外 一 些 同 行 的 认可 (Dallwitz et ail.,，1998; White 
and Sandlant ，1998) ， 近 期 国内 一 些 同 行 也 开始 采用 
DELTA 进行 昆虫 分 类 方面 的 研究 工作 ， 如 张 彦 周 
等 将 DELTA 用 于 跳 小 蜂 分 类 的 研究 (个 人 通讯 )。 
该 系统 同时 也 提供 了 分 类 鉴定 的 功能 ， 但 对 于 普通 
用 户 〈 即 对 分 类 知识 所 知 有 限 而 更 多 需要 提供 防治 
咨询 的 用 户 ) 而 言 则 不 是 十 分 适用 。 李 志 红 
(1999) 研制 的 蔬菜 害虫 辅助 识别 多 媒体 专家 系统 
(PestDiag) 利用 二 叉 式 推理 进行 昆虫 的 鉴定 ， 在 对 
一 般 用 户 的 友好 性 方面 有 了 很 大 改观 ; 但 该 系统 是 
针对 我 国 北方 地 区 常见 蔬菜 害虫 、 以 农民 和 农村 基 
层 工 作者 为 用 户 对 象 开发 的 ， 而 不 是 专门 为 辅助 昆 
虫 分 类 鉴定 的 专业 性 或 学 术 性 工作 来 设计 的 。 同 
时 ， 从 技术 上 来 说 ， 该 系统 中 知识 库 与 推理 机 结合 
在 一 起 ， 不 利于 系统 的 进一步 扩展 。 除 此 之 外 ， 目 
前 有 一 些 昆虫 分 类 鉴定 专家 系统 是 针对 某 些 特定 类 
群 来 设计 的 ， 其 鉴定 特征 的 组 织 、 系 统 的 推理 过 程 
等 对 于 一 般 用 户 及 其 他 类 群 的 昆虫 分 类 专家 而 言 ， 
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都 不 是 十 分 容易 掌握 的 。 

为 了 改进 上 述 工作 ， 本 研究 根据 昆虫 分 类 学 的 
特点 ， 将 昆虫 分 类 中 的 两 项 式 检索 表 用 数据 库 表 示 
成 系统 知识 库 ， 利 用 计算 机 数据 结构 中 二 又 树 结构 
的 分 校 搜索 技术 来 实现 昆虫 分 类 的 辅助 鉴定 ， 这 就 
为 昆虫 分 类 专家 提供 一 个 能 方便 、 快 捷 地 构建 昆虫 
分 类 辅助 鉴定 多 媒体 专家 系统 的 平台 。 该 平台 具有 
可 扩充 性 好 、 设 计 简单 、 操 作 方 便 等 特点 。 昆 虫 分 
类 学 家 只 需 将 他 所 熟悉 的 昆虫 类 群 的 分 类 特征 进行 
总 结 ， 编 制 成 检索 表 ， 然 后 将 检索 表 装 人 系统 知识 
库 ， 就 能 够 形成 特定 类 群 的 辅助 鉴定 专家 系统 ， 提 
供给 缺少 昆虫 分 类 鉴定 知识 的 用 户 使 用 ， 使 他 们 能 
进行 该 类 群 昆虫 的 辅助 识别 与 鉴定 。 因 此 ， 该 系统 
的 研制 将 为 高 效 利 用 昆虫 分 类 学 家 的 专家 知识 资源 
发 挥 重 要 的 作用 。 更 有 意义 的 是 ， 该 系统 作为 一 个 
专家 系统 的 平台 同样 适用 于 一 般 的 生物 学 分 类 鉴 
定 。 


2 系统 的 设计 与 实现 


2.1 系统 的 设计 

该 系统 是 一 个 主要 针对 昆虫 分 类 学 研究 中 昆虫 
鉴定 过 程 的 多 媒体 专家 系统 平台 。 该 系统 可 以 集 文 
字 、 图 像 、 声 音 等 多 媒体 信息 于 一 体 ， 为 昆虫 分 类 
专家 提供 一 个 有 效 的 工具 。 该 系统 主要 包括 昆虫 多 
媒体 知识 库 、 推 理 机 、 系 统 界面 等 几 个 部 分 (如 图 
1 所 示 )。 
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图 1 TaxoKeys 系统 的 基本 结构 及 其 人 机 对 话机 制 


Fig. 1 Structure and principle of man-machine conversation in TaxoKeys 
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根据 系统 功能 的 要 求 及 软件 系统 开发 所 需 遵循 
的 一 些 基 本 原则 (高 灵 旺 等 ，2000)， 本 人 研究 主要 
利用 Borland 公司 提供 的 可 视 化 开发 工具 Delphi 5.0 
( Borland Intemational INC) 进行 程序 设计 ; 硬件 以 
Pentium JII 计算 机 为 主 ， 辅 以 扫描 仪 、 打 印 机 等 一 
些 外 设 进行 多 媒体 图 像 的 处 理 等 。 
2.2 系统 知识 库 的 构建 

检索 表 是 分 类 分 析 的 工具 ， 它 广泛 应 用 于 各 分 
类 单元 的 鉴定 。 在 昆虫 分 类 学 研究 中 ， 一 般 都 是 由 
专家 根据 昆虫 的 特点 编制 成 昆虫 分 类 检索 表 。 在 分 


类 鉴定 过 程 中 ， 根 据 所 获取 样本 的 特点 ， 来 对 照 检 
索 表 进行 查询 鉴定 。 目 前 最 通用 的 检索 表 形 式 是 两 
项 式 检索 表 ， 如 果 与 计算 机 数据 结构 来 对 照 的 话 ， 
应 该 说 这 种 检索 表 的 结构 就 是 一 种 二 义 树 结构 ( 郑 
启 华 ，1996)。 对 于 专家 系统 而 言 ， 如 何 有 效 地 进 
行 专家 知识 的 组 织 ， 也 就 是 系统 专家 知识 库 的 构 
建 ， 对 专家 系统 的 功能 有 很 大 的 影响 。 具 体 到 本 系 
统 ， 如 何 将 上 述 昆 虫 分 类 检索 表 以 数据 库 形式 表示 
成 知识 库 成 为 本 研究 所 要 解决 的 主要 问题 。 本 系统 
知识 库 的 结构 如 表 1 所 示 。 


表 1 昆虫 分 类 系统 知识 库 的 结构 示例 
Table 1 Structure of knowledge database for insect taxonomy in TaxoKeys 


特征 序号 特征 描述 特征 图 像 
No. for characteristic (haracteristic Image of characteristic 
1 特征 一 特征 图 一 
15 特征 十 五 特征 图 十 五 
50 昆虫 一 昆虫 一 形态 图 


该 知识 库 中 不 但 包含 了 昆虫 分 类 检索 表 中 描述 
的 文字 特征 ， 同 时 还 可 包含 传统 分 类 检索 表 中 所 不 
具备 的 各 种 多 媒体 信息 ， 如 昆虫 特征 图 片 、 声 音 
视频 等 ， 如 果 把 这 种 结构 表示 成 二 叉 树 的 形式 ， 那 
么 其 数据 结构 如 图 2 所 示 。 本 系统 知识 库 中 “对 应 
的 下 一 级 特征 序号 ” 值 如 果 为 “-1”， 则 表示 已 到 
达 二 叉 树 菜 一 分 校 的 终止 结 点 。 


多 媒体 特征 (如 声音 、 视 频 等 ) 


对 应 的 下 一 级 特征 序号 


Multimedia of characienishic No. for charactenistic in next node 


15 


530 


2.3 系统 推理 机 的 实现 

推理 机 是 专家 系统 的 一 个 重要 部 分 ， 主 要 实现 
以 已 知 的 信息 来 查找 与 之 相 匹 配 的 客体 。 根 据 本 系 
统 的 设计 ， 推 理 机 的 实现 实际 上 就 是 完成 对 上 述 二 
叉 树 结构 分 校 结 点 的 搜索 过 程 。 其 工作 流程 图 如 图 
3 所 示 。 
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图 2 系统 知识 库 所 对 应 的 二 叉 树 数据 结构 图 


Fig. 2 Chart of dichotomous-tree structure of the data in TaxoKeys” knowledge base 
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图 3 系统 推理 机 的 工作 流程 图 


Fig. 3 The flow chart of the reasoning-machine in TaxoKeys 


2.4 系统 界面 的 设计 与 实现 

系统 界面 部 分 与 昆虫 分 类 学 家 、 用 户 等 直接 打 
交道 ， 对 于 用 户 来 说 ， 它 定义 了 系统 的 外 观 映 象 ， 
也 是 系统 用 户 友 好 性 的 直接 体现 。 设 计 应 用 程序 界 
面 就 是 实现 这 神 映 象 ， 使 用 户 与 系统 相 沟 通 。 本 系 
统 的 界面 主要 包括 辅助 鉴定 界面 、 系 统 知识 库 维护 
界面 等 。 辅 助 鉴定 界面 为 用 户 提 供 系 统 使 用 通道 ， 
该 界面 包括 昆虫 分 类 特征 提问 时 所 涉及 的 各 种 媒体 
信息 ， 如 文字 、 图 像 、 声 音 等 ， 用 户 只 需 在 该 界面 
上 选择 按钮 “是 ”或 “ 否 ” 即 可 进行 下 一 步 操 作 ， 
最 后 的 鉴定 结果 也 以 多 媒体 信息 通过 该 界面 显示 
(界面 如 图 4 所 示 )。 系 统 知 识 库 维护 界面 则 主要 是 
提供 给 昆虫 分 类 学 专家 将 检索 表 信 息 装 人 专家 知识 
库 而 设计 的 ， 因 此 是 一 个 数据 库 操 作 界 面 。 


3 讨论 

本 系统 的 设计 根据 昆虫 分 类 学 的 特点 ， 采 用 了 
十 分 简单 的 结构 ， 即 计算 机 数据 中 的 二 叉 树 结构 ， 
实现 了 将 昆虫 分 类 学 中 的 检索 表 表 达成 专家 系统 知 
识 数 据 库 ， 实 现 了 系统 知识 库 与 推理 机 的 分 离 ， 使 
得 该 系统 的 结构 十 分 简单 ， 操 作 及 系统 的 维护 均 十 
分 方便 ,昆虫 分 类 专家 不 需 懂 多 少 计 算 机 知识 ， 只 
需 根据 其 传统 的 昆虫 分 类 方法 编制 好 检索 表 ， 然 后 
将 检索 表 内 容 装 人 系统 知识 库 即 可 ， 不 需 对 源 程 序 
进行 任何 修改 ; 知识 库 的 维护 也 只 需 通过 系统 提供 
的 知识 库 维护 界面 就 可 进行 昆虫 特征 的 增 、 删 、 改 
等 多 种 操作 。 根 据 White 和 Sandlant (1998) 的 研 
究 ， 本 系统 所 采用 的 数据 组 织 方式 数据 量 较 大 。 但 
这 种 方式 比 多 条 目 检 索 方式 用 户 友好 性 方面 却 大 为 
改进 ， 同 时 当前 计算 机 运行 速度 的 提高 完全 能 够 弥 
补 因 为 数据 组 织 所 造成 的 系统 运行 速度 慢 的 问题 ， 
因此 这 种 牺牲 也 是 值得 的 。 : 

从 系统 的 功能 来 看 ， 本 系统 只 是 提供 了 一 个 昆 
虫 分 类 辅助 鉴定 多 媒体 专家 系统 的 平台 ， 只 有 依靠 
昆虫 分 类 学 专家 的 劳动 ， 建 立 起 各 种 昆虫 类 群 的 分 
类 检索 表 ， 并 将 检索 表 内 容 装 人 知识 库 ， 才 能 充分 
发 挥 本 系统 的 功能 ; 同时 ， 系 统 对 某 一 特定 类 群 昆 
虫 鉴 定 的 准确 性 也 将 依赖 于 专家 知识 的 准确 程度 。 
有 鉴于 此 ， 我 们 也 设想 将 上 述 提 到 的 DELTA 与 本 
系统 作为 同一 系列 进行 使 用 ， 也 就 是 由 分 类 专家 以 
DELTA 来 构建 分 类 检索 表 ， 然 后 将 检索 表 导 人 本 
系统 中 构建 分 类 鉴定 专家 系统 供 一 般 用 户 使 用 。 当 
然 这 种 设想 实现 的 前 提 是 需 建 立 DELTA 及 本 系统 
之 间 的 接口 。 目 前 我 们 正 对 此 进行 探索 。 另 外 ， 目 
前 该 系统 还 是 一 个 初步 的 框架 ， 一 些 必 要 的 功能 尚 
有 待 于 进一步 完善 。 如 果 为 该 系统 进一步 增添 解释 
机 制 、 学 习 机 制 等 多 方面 的 功能 ， 必 然 会 使 该 系统 
成 为 一 个 更 具 代 表 性 、 更 能 体现 昆虫 分 类 学 专家 思 
想 的 理想 工具 。 

由 于 一 般 生 物 学 分 类 与 昆虫 分 类 具有 相同 的 特 
点 ， 因 此 该 系统 同样 适用 于 一 般 生 物 学 分 类 ， 可 作 
为 一 般 生 物 学 分 类 鉴定 的 辅助 工具 进行 应 用 。 同 
时 ， 由 于 该 系统 所 采用 的 分 类 鉴定 知识 库 与 推理 机 
方法 十 分 简单 ， 因 此 也 可 以 方便 地 移植 到 Intemet 
网 络 上 进行 应 用 。 可 以 预见 ， 该 系统 的 应 用 前 景 是 
十 分 广阔 的 。 
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图 4 系统 的 辅助 鉴定 界面 


Fig. 4 The interface for assistant identification in TaxoKeys 
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